Se incluyeron 20 personas voluntarias (18 mujeres), en un rango de edad de …, su nivel educativo mínimo fue licenciatura, se trató de estudiantes de estado civil soltero. Todos los participantes reportaron no tener historial médico de tipo neurológico ni psiquiátrico al momento del experimento. Los participantes acudieron con un amigo considerado cercano por ellos mismos, quien cumplía las siguientes características: era una persona del mismo sexo que el participante, no tenía un vínculo familiar y no se trataba de una persona con una relación de tipo sentimental y/o sexual.
Se trata de una adaptación de la tarea de confianza y promesas presentada por Baumgartner (2009), que consiste en 24 ensayos entre dos jugadores A y B, el jugador A tiene originalmente 0 pesos mexicanos y el jugador B tiene 2 pesos, al jugador B se le presenta la oportunidad de invertir su dinero al jugador A o conservarlo, si invierte su dinero se multiplica por 5 pesos, de modo que el jugador A recibe 10 pesos. Finalmente, el jugador A toma la decisión de pagar la mitad al jugador B o quedarse los 10 pesos. La estructura descrita se repite en 24 ensayos, sin embargo, en 4 de los ensayos el jugador A puede enviar una promesa a B, las promesas son que siempre, casi siempre, algunas veces o nunca pagaran la mitad. Cada promesa es válida por tres ensayos, de modo que 12 de los ensayos tienen el efecto de la promesa y los otros 12 no lo tienen.
La variación respecto a la tarea original es que en nuestro experimento se presentan tres compañeros de juego con tres niveles de cercanía social computadora (cercanía nula), confederado (cercanía baja) y amigo (cercanía alta) en el papel del jugador B, mientras que el sujeto siempre realiza el papel de jugador A. Cada compañero de juego realizó el rol de B en 8 de los 24 ensayos totales, sin embargo, tanto la condición de promesas como la de cercanía social fueron presentadas al sujeto A en orden pseudoaleatorio (ya que se mantuvo el mismo orden en la tarea para todos los sujetos).
Con el fin de simplificar la tarea y homogeneizar la experiencia de todos nuestros participantes, se programaron a priori las decisiones de los compañeros B sobre si invertían o no su monto inicial, se programó que los tres compañeros decidieran invertir en 6 ensayos y no invertir en 2, los cuales también se presentaron al sujeto A en orden pseudoaleatorio. La historia encubierta para todos nuestros sujetos en el papel de A fue que estarían jugando en tiempo real con su amigo, el confederado (que se le dijo que sería otra persona desconocida de su mismo sexo) y la computadora.
Se obtuvieron las proporciones de las decisiones pagar o no pagar la mitad, así como las promesas realizadas, posteriormente se calcularon las variaciones en las proporciones de acuerdo a los compañeros de juego y la condición de presencia o ausencia de promesas.
Se utilizó inferencia bayesiana para evaluar el efecto de las condiciones experimentales en la tasa de pago a nivel individual y poblacional. Para tal propósito se realizó un modelo jerárquico que asume que la incertidumbre en el efecto de promesas y parejas sobre la conducta de cada individuo proviene de distribuciones poblacionales comunes para los parámetros del modelo:
\[ \begin{aligned} &y_i \sim \mathrm{Bernoulli}(\theta_i) \\ &\mathrm{logit(\theta_i)} = \mathbf{X}\beta + \mathbf{Z}u \end{aligned} \] En el modelo anterior, cada decisión \(y_i\) proviene de una distribución Bernoulli con probabilidad de pagar \(\theta_i\), el objetivo del modelo jerárquico es predecir cada decisión a través la combinación lineal de los predictores transformados por su función ligadora inversa \(\mathrm{logit}\). En el modelo anterior, \(\beta\) y \(u\) son coeficientes a nivel poblacional y nivel individual respectivamente, mientras que \(\mathbf{X}\), \(\mathbf{Z}\) son sus correpondientes matrices del diseño.
El modelo estima que la probabilidad \(\theta_i\) de que en cada ensayo se decida pagar la mitad está en función del efecto de la presencia de promesas \(\beta^{promise}\), así como de los compañeros con cercanía social baja \(\beta^{confederate}\) y alta \(\beta^{friend}\). También asume que pueden existir diferencias individuales en el desempeño durante la tarea, las cuales son captadas por los parámetros \(u\) y constituyen ajustes a los coeficientes poblacionales. Cabe remarcar que el modelo evalúa explícitamente la incertidumbre respecto a \(u\), lo cual es una ventaja con relación a los modelos que asumen que \(u\) es parte del término de error.
El modelo se programó en R por medio del paquete brms, que realiza la inferencia mediante el muestreo por Markov chain Monte Carlo a través de Stan. Las distribuciones posteriores de todos los parámetros fueron aproximadas con cuatro cadenas de 2000 iteraciones cada una, las primeras 1000 iteraciones de cada cadena fueron descartadas (periodo de calentamiento), para un total de 4000 muestras post-calentamiento. La convergencia del modelo fue evaluada a través de la inspección visual de las cadenas y el cálculo del estadístico \(\hat{R}\), que para todos los parámetros fue de 1, lo que se interpreta como convergencia.
Asume que las decisiones de los individuos podrían provenir de una combinación (o mezcla) de procesos psicológicos no observables (latentes), el rasgo latente más importante en este experimento es la (des)honestidad. Se modelaron las diferencias en las tasas de pago entre participantes como una combinación de \(N\) distribuciones de subpoblaciones. El modelo asumió que las tasas de pago provenían de una o dos mezclas de distribuciones, o grupos latentes.
El modelo de una mezcla, asumía que cada decisión \(d_{i,j}\) de cada sujeto provenía de una distribución Bernoulli con probabilidad \(\theta_{i,j}\). Asimismo que \(\theta_{i,j}\) provenía de una distribución jerárquica Beta con parámetros \(\alpha\) y \(\beta\). La distribución Beta fue reparametrizada en términos de media \(\mu\) y precisión \(\lambda\), ya que \(\mu = \alpha/(\alpha + \beta)\) y \(\lambda = \alpha + \beta\).
\[ \begin{aligned} &\mu \sim \mathrm{Uniform}(0, 1)\\ &\lambda \sim \mathrm{Uniform}(4, 100)\\ &\theta_{i,j} \sim \mathrm{Beta}(\mu\lambda, (1 - \mu)\lambda)\\ &d_{i,j} \sim \mathrm{Bernoulli}(\theta_{i,j}) \end{aligned} \]
El modelo de dos mezclas es aproximadamente igual al anterior, sin embargo ahora asume que las decisiones provienen de una mezcla de las distribuciones de dos grupos, una distribución Beta con parámetros \(\mu_1\lambda_1\) y \((1 - \mu_1) \lambda_1\) y otra con párametros \(\mu_2\lambda_2\) y \((1 - \mu_2) \lambda_2\), el parámetro \(z_i\) determina la probabilidad de que cada sujeto pertenezca a uno de dos grupos latentes, se distribuye Bernoulli con probabilidad \(\phi\), que a su vez sigue una distribución inicial Beta relativamente poco informativa.
Se presenta el modelo de 2 mezclas con la notación propuesta por Lee, nodos cuadrados representan variables discretas y nodos circulares variables numéricas. Los nodos sombreados representan variables observadas, mientras que los nodos no sombreados son variables latentes. Los dos rectángulos representan repeticiones de la relación entre los parámetros del modelo para cada sujeto \(i\) y ensayo \(j\). Se determinó que un individuo pertenecía al grupo de Deshonestos si \(z_i < 0.5\), dado que la probabilidad de que ese sujeto pagara la mitad en cada ensayo es baja, mientras que se consideró que un individuo pertenecía al grupo de Honestos si \(z_i > 0.5\), dado que la probabilidad de que el individuo pague la mitad en cada ensayo es alta.
\[ \begin{aligned} &\mu_1 \sim \mathrm{Uniform}(0, 1)\\ &\mu_2 \sim \mathrm{Uniform}(\mu_1, 1)\\ &\lambda_{1:2} \sim \mathrm{Uniform}(4, 100)\\ &z_i \sim \mathrm{Bernoulli}(\phi)\\ &\theta_{i,j} \sim \Bigg\{ \begin{array} {lr} \mathrm{Beta}(\mu_1\lambda_1, (1 - \mu_1)\lambda_1) & \mbox{if} & z_i = 0 \\ \mathrm{Beta}(\mu_2\lambda_2, (1 - \mu_2)\lambda_2) & \mbox{if} & z_i = 1 \end{array} \\ &d_{i,j} \sim \mathrm{Bernoulli}(\theta_{i,j})\\ &\phi \sim \mathrm{Beta}(5, 5) \end{aligned} \]
Los modelos de 1 y 2 mezclas, se programaron en R mediante el paquete rjags, que realiza la inferencia mediante el muestreo por Markov chain Monte Carlo a través de JAGS. Las distribuciones posteriores de todos los parámetros fueron aproximadas con tres cadenas de 26000 iteraciones cada una, se descartaron las primeras 6000 de cada cadena como periodo de calentamiento, para un total de 60000 muestras post-calentamiento. La convergencia del modelo fue evaluada a través de la inspección visual de las cadenas y el cálculo del estadístico \(\hat{R}\), que varió de 1 a 1.05 para todos los parámetros lo que indica convergencia.
Un hallazgo constante en la investigación sobre engaño y deshonestidad, es la diferencia en los tiempos de reacción entre quienes toman decisiones deshonestas vs. decisiones honestas, en general, se han encontrado latencias breves en personas deshonestas en comparación con las de las personas honestas.
Se estimaron las medias poblacionales del grupo de deshonestos y honestos mediante un modelo bayesiano jerárquico que asumía que el tiempo de reacción proviene de una distribución \(rt_i \sim \mathrm{Half-Normal}(0, 5)\) (dado que no puede haber tiempos de reacción negativos), con parámetros \(\mu_{Dishonest}\) y \(\mu_{Honest}\) y desviación estándar común \(\sigma\).
Asimismo, se modeló la variabilidad intrasujeto en los tiempos de reacción por medio de interceptos variantes por participante. El modelo se ajustó en R por medio de brms y Stan en condiciones iguales a las descritas anteriormente y con resultados adecuados de convergencia para todos los parámetros, \(\hat{R} = 1\).
Para los modelos de la tasa de pago y tiempo de reacción se utilizó el factor de Bayes por medio del método de Savage-Dickey, que calcula la razón de la densidad de la distribución posterior sobre la densidad de la distribución inicial de algún parámetro en el punto de interés. Específicamente para el modelo de la tasa de pago, se evaluó la hipótesis de si las promesas tendrían un efecto positivo en las tasas de pago (\(H_1: \beta^{promise} > 0\)), así como si la cercanía social alta (amigo) tendría mayores tasas de pago que la cercanía social baja (confederado) (\(H_1: \beta^{friend} - \beta^{confederate} > 0\)). Para el modelo del tiempo de reacción, la hipótesis fue si los deshonestos tendrían tiempos breves en comparación con los honestos (\(H_1: \mu_{Dishonest} - \mu_{Honest} < 0\)).
Los modelos de una y dos mezclas se compararon por medio del criterio de información DIC (deviance information criteria), en el que los puntajes bajos indican mejores modelos. La estimación de la diferencia entre el modelo de 1 y 2 mezclas favorece al modelo de dos mezclas (\(\mathrm{Difference}= 1.21\), \(\mathrm{SE}= 3.49\)).
Se muestra en la figura 1, la frecuencia de veces en que los participantes pagaron la mitad, así como la frecuencia de promesas que fueron seleccionadas. En la figura 2, se muestra la proporción de pagos realizados dependiendo de cada pareja y de la condición de promesas.
Fig. 1 Frecuencies of paying and Promise choice
Fig. 2 Rates by partners and promise condition
En la tabla 1, se muestran los efectos poblacionales del modelo bayesiano jerárquico para la tasa de pago. Se presentan las estimaciones de cada coeficiente del modelo en escala logit, su error estándar y los intervalos de credibilidad bayesianos del 95%. Los cuales indican los límites inferiores y superiores de las estimaciones entre los que se ubica el 95 % de probabilidad.
| Term | Estimate | SE | L-95% CI | U-95% CI |
|---|---|---|---|---|
| \(\beta^0\) | -1.62 | 0.40 | -2.31 | -1.02 |
| \(\beta^{promise}\) | 1.27 | 0.40 | 0.64 | 1.92 |
| \(\beta^{confederate}\) | 2.01 | 0.55 | 1.20 | 2.97 |
| \(\beta^{friend}\) | 4.15 | 0.77 | 3.07 | 5.49 |
La figura 3A muestra la incertidumbre con respecto a la estimación de los coeficientes, la linea central indica la mediana de la distribución y el área sombreada el intervalo del 50 % de probabilidad. Para visualizar el efecto conjunto de las condiciones experimentales en la probabilidad de pagar la mitad, se realizó su combinación lineal para obtener un sólo predictor (\(\mathrm{linpred_i}\)), se le aplicó la función ligadora inversa logit y se transformó su output en probabilidades por medio de la función logistica \(1 / (1 + \exp(-\mathrm{linpred}_i))\).
La figura 3B muestra la probabilidad de pagar la mitad, como función de la combinación lineal de las condiciones experimentales, las lineas delgadas muestran la incertidumbre en la predicción con una muestra aleatoria de tamaño 100 de las distribuciones posteriores de los parámetros poblacionales. La linea gruesa representa la media de las distribuciones posteriores de los parámetros poblacionales.
Fig. 3 Estimates with uncertainty and linear predictor
En un procedimiento similar al descrito para la figura 3B, la figura 4 representa el efecto conjunto de las condiciones experimentales en la probabilidad de pagar la mitad para cada sujeto. Ya que el modelo jerárquico asume que las diferencias individuales se pueden modelar realizando un ajuste \(u\) a los coeficientes poblacionales \(\beta\), se obtuvieron 50 muestras aleatorias de las distribuciones posteriores de los parámetros \(u\) para cada sujeto, se realizó el ajuste al modelo poblacional y se presenta en lineas delgadas la incertidumbre en la predicción individual.
Fig. 4 Estimates with uncertainty by subject
La distribución posterior predictiva consiste en simular el tipo de observaciones que podrían surgir con el modelo original, pero una vez que los parámetros de éste han sido actualizados con los datos observados. En este caso, cuando el modelo ha aprendido de las decisiones de los sujetos, tiene la capacidad de generar una “replica” de los datos observados, por cada combinación de los parámetros obtenidos en la distribución posterior.
En la figura 5, se obtuvieron 50 muestras aleatorias de la distribución posterior de los parámetros poblacionales \(\beta\) y se simularon 50 datasets con las decisiones que se esperarían con esos parámetros. Se presentan en barras las decisiones realizadas por nuestros participantes \(y\), mientras que el punto con dispersión muestra la distribución de los valores esperados en las 50 replicas \(y_{rep}\).
Fig. 5 Posterior predictive distribution of choices by partner
El modelo de 2-mezclas latentes identificó dos subpoblaciones de tamaño 10; en la tabla 2 se muestran los resúmenes de las distribuciones posteriores de los parámetros de ambas subpoblaciones y el parámetro de la mezcla \(\phi\). Una de las subpoblaciones tiene alta probabilidad de pagar \(\mu_1\), la que denominamos honestos y la otra subpoblación tiene una probabilidad de pagar menor por lo que fue denominada deshonestos \(\mu_2\). En la figura 6A se muestran las distribuciones posteriores de las dos \(\mu\)’s, correspondientes a la probabilidad de pagar de los dos grupos latentes. Y en la figura 6B se presentan las decisiones de dos sujetos extraídos de las dos subpoblaciones, el sujeto 5 de la subpoblación de deshonestos y el 17 de la subpoblación de honestos. En la figura 7 se muestra la frecuencia de las decisiones de los dos grupos latentes, dependiendo de si estaban en la condición con o sin promesa.
| Parameter | Mean | SD | L-95% CI | U-95% CI |
|---|---|---|---|---|
| \(\mu_{1}\) | 0.56 | 0.05 | 0.44 | 0.65 |
| \(\mu_{2}\) | 0.70 | 0.05 | 0.61 | 0.82 |
| \(\lambda_{1}\) | 48.99 | 28.57 | 5.50 | 97.49 |
| \(\lambda_{2}\) | 54.79 | 26.24 | 7.80 | 97.61 |
| \(\phi\) | 0.49 | 0.15 | 0.21 | 0.77 |
Fig. 6 Posteriors from two latent groups and two cases
Fig. 7 Payment frecuency by latent group and promise condition
En la tabla 3 se presentan las estimaciones poblacionales del modelo bayesiano de los tiempos de reacción, se resumen las distribuciones posteriores de cada parámetro, incluyendo la estimación de su media, su error estándar y los intervalos de credibilidad bayesianos del 95%. En la figura 8A se muestran con puntos los tiempos de reacción en segundos para cada decisión realizada de acuerdo con cada subgrupo, se agregó a cada grupo un kernel de densidad simétrico para representar la cantidad de casos acumulados a lo largo de los diferentes valores del tiempo de reacción.
En la figura 8B se presenta la diferencia de las estimaciones posteriores, el punto con dispersión representa el estimador puntual de la diferencia entre las subpoblaciones y el intervalo de credibilidad bayesiano del 95%. El histograma representa la distribución posterior de la diferencia entre los parámetros de las subpoblaciones.
| Term | Estimate | SE | L-95% CI | U-95% CI |
|---|---|---|---|---|
| \(\mu_{Dishonest}\) | 2.93 | 0.23 | 2.55 | 3.31 |
| \(\mu_{Honest}\) | 3.06 | 0.22 | 2.69 | 3.42 |
| \(\mu_{difference}\) | -0.13 | 0.32 | -0.77 | 0.52 |
| \(\sigma\) | 1.23 | 0.05 | 1.15 | 1.31 |
| \(\sigma_{subject}\) | 0.65 | 0.14 | 0.45 | 0.89 |
Fig. 8 Differences in reaction time by latent group
En la tabla 4 se muestran las hipótesis contrastadas, las estimaciones, los errores estándar y el factor de Bayes (BF) para cada una. Se interpretan los BF’s como evidencia en favor de la hipótesis alterna \(BF_{10}\) de acuerdo a la clasificación de Jeffreys (1961). La hipótesis uno de si la condición de promesas tiene un efecto superior a 0, se interpreta como “evidencia extrema” a su favor, la hipótesis de si el efecto en la tasa de pago es superior para el amigo que para el confederado también se interpreta como “evidencia superior” a su favor, la hipótesis sobre si la diferencia entre los tiempos de reacción entre honestos y deshonestos es menor a cero, se interpreta como “evidencia anecdótica” a su favor.
Dado que el intervalo de credibilidad bayesiano para la estimación de la diferencia entre los tiempos de reacción de las subpoblaciones incluye el cero, se decidió evaluar la hipótesis de si la diferencia es igual a 0, el BF correspondiente se interpreta como “evidencia fuerte” en favor a la diferencia igual a 0. Finalmente, se comparó el DIC para los modelos de una (\(DIC_{1}\)) y dos (\(DIC_{2}\)) mezclas, cuya diferencia apoya al modelo de dos mezclas latentes.
| Hypothesis | Estimate | SE | BF\(_{10}\) |
|---|---|---|---|
| \(\beta^{promise} > 0\) | 1.27 | 0.40 | 499 |
| \(\beta^{friend} - \beta^{confederate} > 0\) | 2.14 | 0.77 | 665.67 |
| \(\mu_{Dishonest} - \mu_{Honest} < 0\) | -0.13 | 0.32 | 1.96 |
| \(\mu_{Dishonest} - \mu_{Honest} = 0\) | -0.13 | 0.32 | 20.36 |
| \(DIC_{1} - DIC_{2}\) | 1.21 | 3.49 | - |